Exploración de los datos abiertos de COVID-19 México


Síguenos en nuestra página de Facebook "Análisis y visualización de datos"

https://www.facebook.com/An%C3%A1lisis-y-visualizaci%C3%B3n-de-datos-100602148375744/?ti=as

Introducción

La pandemia COVID-19 es uno de las peores situaciones que nos ha tocado vivir en México y en el mundo en los últimos años. Si bien, podemos obtener información acerca de la situación de esta pandemia en nuestro país en las conferencias emitidas diariamente, siempre quedan preguntas o nos surge algún interés en particular. Para esto, la Secretaría de Salud en su página de COVID publica los datos abiertos que utilizan para realizar algunos de los los análisis que muestran diario. El tener disponibles estos datos nos permite explorar más allá de lo que nos muestran, resolver nuestros propios intereses y tratar de estar mejor informados y cuestionarnos acerca de lo que los medios informan.

En esta ocasión, decidí trabajar en los los Datos Abiertos de COVID-19 para poder compartirlo con ustedes, presentando distintas visualizaciones que nos ayuden a entender como ha ido evolucionando la pandemia en el pais y mantenernos informados en algo que es de interés público. Al mismo tiempo, si tienen alguna duda, interés en explorar algo o comentarios acerca del análisis, me pueden dejar sus comentarios en nuestra página de Facebook "Análisis y visualización de datos". El análisis lo estoy actualizando periódicamente.

Cabe aclarar que en esta exploración de los datos de COVID19 no muestro modelos ni predicciones ya que no estoy especializado en cuestiones epidemiológicas.

En una vista rápida de los datos, con un formato más completo, podemos ver la siguente información:

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
0 2020-08-27 0c98bd 2 IMSS 12 HOMBRE GUERRERO GUERRERO AMBULATORIA 2020-04-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA ACAPULCO DE JUÁREZ
1 2020-08-27 15b849 2 IMSS 14 MUJER JALISCO JALISCO HOSPITALIZADO 2020-04-08 ... SI NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO GUADALAJARA
2 2020-08-27 0ad701 2 IMSS 9 MUJER CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-04-15 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLÁHUAC
3 2020-08-27 076f46 2 IMSS 2 HOMBRE BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-17 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
4 2020-08-27 1762e4 2 IMSS 23 MUJER YUCATAN QUINTANA ROO AMBULATORIA 2020-04-14 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA BENITO JUÁREZ

5 rows × 35 columns

Exploración de los datos

Los datos contienen a todos los sujetos que se han analizado hasta el momento (confirmados, negativos y pendientes).

El siguiente resultado contiene el número de sujetos(renglones) y el número de variables (columnas) presente:

(1304776, 35)

La tabla contiene las siguientes columnas las cuales pueden revisar para generar nuevas preguntas dependiendo de su interés.

Index(['FECHA_ACTUALIZACION', 'ID_REGISTRO', 'ORIGEN', 'SECTOR', 'ENTIDAD_UM',
       'SEXO', 'ENTIDAD_NAC', 'ENTIDAD_RES', 'TIPO_PACIENTE', 'FECHA_INGRESO',
       'FECHA_SINTOMAS', 'FECHA_DEF', 'INTUBADO', 'NEUMONIA', 'EDAD',
       'NACIONALIDAD', 'EMBARAZO', 'HABLA_LENGUA_INDIG', 'DIABETES', 'EPOC',
       'ASMA', 'INMUSUPR', 'HIPERTENSION', 'OTRA_COM', 'CARDIOVASCULAR',
       'OBESIDAD', 'RENAL_CRONICA', 'TABAQUISMO', 'OTRO_CASO', 'RESULTADO',
       'MIGRANTE', 'PAIS_NACIONALIDAD', 'PAIS_ORIGEN', 'UCI', 'MUNICIPIO'],
      dtype='object')

Antes de continuar, debemos aclarar algunas variables presentes en los datos que estan realacionadas con fechas:

  • FECHA_ACTUALIZACIÓN: Corresponde a la fecha de los datos publicados.
  • FECHA_INGRESO: Fecha en la que el paciente ingreso al hospital.
  • FECHA_SINTOMAS: Fecha en la que el paciente empezó con los síntomas.
  • FECHA_DEF: Presenta fecha sí el paciente desafortunadamente falleció.

Datos generales

A partir de la tabla anterior ocupamos la columna RESULTADO para contar a los sujetos con resultado a la prueba de COVID-19 positivos, negativos o pendientes.

Número de personas confirmadas con COVID-19: 579914
Número de personas con resultado negativo a COVID-19: 643265
Número de personas que esperan un resultado de la prueba de COVID-19: 81597
Número de fallecimientos con COVID-19 positivo: 62594
Número de sujetos analizados hasta el momento: 1304776

Algo que notamos en los datos es la presencia de sujetos que tienen una confirmación en la prueba de COVID-19, pero que su fecha de SINTOMAS fue antes de los primeros casos de COVID-19 en México (finales de Febrero).

En una conferencia se aclaró que estas incosistencias se deben a errores al momento de registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
4066 2020-08-27 135d2f 2 SSA 25 HOMBRE CIUDAD DE MEXICO HIDALGO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA PACHUCA DE SOTO
4949 2020-08-27 044a42 2 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA GUSTAVO A. MADERO
19984 2020-08-27 05f3d3 1 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO SI SI POSITIVO NO ESPECIFICADO México 99 SI IZTAPALAPA
33336 2020-08-27 17235f 2 IMSS 19 HOMBRE NUEVO LEON NUEVO LEON AMBULATORIA 2020-01-13 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA SAN NICOLÁS DE LOS GARZA
40599 2020-08-27 189846 2 SSA 15 HOMBRE CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-02-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALNEPANTLA DE BAZ
116407 2020-08-27 12a243 2 SSA 9 MUJER CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-24 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALPAN
159566 2020-08-27 06e286 2 SSA 5 MUJER COAHUILA DE ZARAGOZA COAHUILA DE ZARAGOZA AMBULATORIA 2020-02-28 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TORREÓN
231811 2020-08-27 194f98 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO MIGUEL HIDALGO
275568 2020-08-27 18ecd7 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO MEXICO HOSPITALIZADO 2020-04-01 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 SI NEZAHUALCÓYOTL
278498 2020-08-27 1732a3 2 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-14 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
280122 2020-08-27 04f68c 2 PRIVADA 15 HOMBRE NO ESPECIFICADO MEXICO HOSPITALIZADO 2020-03-04 ... NO NO NO NO POSITIVO NO ESPECIFICADO Italia 99 NO HUIXQUILUCAN
280147 2020-08-27 0aad01 2 SSA 7 MUJER CIUDAD DE MEXICO CHIAPAS AMBULATORIA 2020-02-29 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TUXTLA GUTIÉRREZ
280730 2020-08-27 0f634f 1 IMSS 25 MUJER SINALOA SINALOA AMBULATORIA 2020-01-29 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA CULIACÁN
623582 2020-08-27 178775 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-04-02 ... NO NO NO SI PENDIENTE NO ESPECIFICADO México 99 NO APLICA IZÚCAR DE MATAMOROS
624782 2020-08-27 003ca9 2 IMSS 22 HOMBRE QUERETARO QUERETARO AMBULATORIA 2020-02-07 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA QUERÉTARO
627669 2020-08-27 114288 2 IMSS 19 MUJER NUEVO LEON NUEVO LEON HOSPITALIZADO 2020-05-15 ... SI SI SI NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO LINARES
628631 2020-08-27 06cf4c 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-03-30 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA PUEBLA
629773 2020-08-27 063f1e 2 IMSS 20 HOMBRE OAXACA OAXACA AMBULATORIA 2020-01-30 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA NAZARENO ETLA

18 rows × 35 columns

Como primera visualización podemos ver una gráfica de barras los valores NEGATIVOS, POSITIVOS y PENDIENTES por día.

Confirmados con COVID-19

La columna ENTIDAD_RES contiene la entidad en donde se encontraba el sujeto al momento de registrar sus datos.

Podemos agrupar los datos y presentarlos en una tabla con un gradiente para mostrar los Estados con mayor número de casos de COVID-19.

ENTIDAD TOTAL
0 CIUDAD DE MEXICO 95185
1 MEXICO 66376
2 GUANAJUATO 29912
3 NUEVO LEON 27755
4 VERACRUZ DE IGNACIO DE LA LLAVE 27669
5 TABASCO 27635
6 PUEBLA 26286
7 TAMAULIPAS 23906
8 SONORA 21110
9 COAHUILA DE ZARAGOZA 20788
10 JALISCO 19231
11 SAN LUIS POTOSI 17079
12 BAJA CALIFORNIA 16326
13 SINALOA 15747
14 GUERRERO 14432
15 MICHOACAN DE OCAMPO 14347
16 YUCATAN 14223
17 OAXACA 13271
18 QUINTANA ROO 10068
19 HIDALGO 9945
20 CHIHUAHUA 7586
21 BAJA CALIFORNIA SUR 7276
22 CHIAPAS 6231
23 DURANGO 6165
24 TLAXCALA 6121
25 QUERETARO 5985
26 CAMPECHE 5484
27 AGUASCALIENTES 5399
28 MORELOS 5074
29 ZACATECAS 5017
30 NAYARIT 4817
31 COLIMA 3468

O representarlo en una gráfica de barras.

También podemos agrupar los casos confirmados por día y su acumulado.

FECHA TOTAL TOTAL_ACCU
0 2020-01-13 00:00:00 1 1
1 2020-01-29 00:00:00 1 2
2 2020-02-06 00:00:00 1 3
3 2020-02-19 00:00:00 1 4
4 2020-02-21 00:00:00 1 5
5 2020-02-22 00:00:00 2 7
6 2020-02-23 00:00:00 1 8
7 2020-02-24 00:00:00 1 9
8 2020-02-25 00:00:00 1 10
9 2020-02-26 00:00:00 1 11
10 2020-02-27 00:00:00 2 13
11 2020-02-28 00:00:00 2 15
12 2020-02-29 00:00:00 2 17
13 2020-03-01 00:00:00 6 23
14 2020-03-02 00:00:00 8 31
15 2020-03-03 00:00:00 6 37
16 2020-03-04 00:00:00 7 44
17 2020-03-05 00:00:00 7 51
18 2020-03-06 00:00:00 10 61
19 2020-03-07 00:00:00 21 82
20 2020-03-08 00:00:00 21 103
21 2020-03-09 00:00:00 64 167
22 2020-03-10 00:00:00 50 217
23 2020-03-11 00:00:00 51 268
24 2020-03-12 00:00:00 60 328
25 2020-03-13 00:00:00 88 416
26 2020-03-14 00:00:00 91 507
27 2020-03-15 00:00:00 100 607
28 2020-03-16 00:00:00 133 740
29 2020-03-17 00:00:00 111 851
30 2020-03-18 00:00:00 123 974
31 2020-03-19 00:00:00 113 1087
32 2020-03-20 00:00:00 183 1270
33 2020-03-21 00:00:00 132 1402
34 2020-03-22 00:00:00 141 1543
35 2020-03-23 00:00:00 222 1765
36 2020-03-24 00:00:00 182 1947
37 2020-03-25 00:00:00 211 2158
38 2020-03-26 00:00:00 249 2407
39 2020-03-27 00:00:00 289 2696
40 2020-03-28 00:00:00 276 2972
41 2020-03-29 00:00:00 266 3238
42 2020-03-30 00:00:00 387 3625
43 2020-03-31 00:00:00 311 3936
44 2020-04-01 00:00:00 467 4403
45 2020-04-02 00:00:00 440 4843
46 2020-04-03 00:00:00 445 5288
47 2020-04-04 00:00:00 454 5742
48 2020-04-05 00:00:00 434 6176
49 2020-04-06 00:00:00 587 6763
50 2020-04-07 00:00:00 517 7280
51 2020-04-08 00:00:00 630 7910
52 2020-04-09 00:00:00 635 8545
53 2020-04-10 00:00:00 969 9514
54 2020-04-11 00:00:00 733 10247
55 2020-04-12 00:00:00 781 11028
56 2020-04-13 00:00:00 974 12002
57 2020-04-14 00:00:00 917 12919
58 2020-04-15 00:00:00 1057 13976
59 2020-04-16 00:00:00 1040 15016
60 2020-04-17 00:00:00 1185 16201
61 2020-04-18 00:00:00 1278 17479
62 2020-04-19 00:00:00 1152 18631
63 2020-04-20 00:00:00 1876 20507
64 2020-04-21 00:00:00 1234 21741
65 2020-04-22 00:00:00 1270 23011
66 2020-04-23 00:00:00 1323 24334
67 2020-04-24 00:00:00 1571 25905
68 2020-04-25 00:00:00 1631 27536
69 2020-04-26 00:00:00 1456 28992
70 2020-04-27 00:00:00 1782 30774
71 2020-04-28 00:00:00 1569 32343
72 2020-04-29 00:00:00 1418 33761
73 2020-04-30 00:00:00 1972 35733
74 2020-05-01 00:00:00 2672 38405
75 2020-05-02 00:00:00 1928 40333
76 2020-05-03 00:00:00 1831 42164
77 2020-05-04 00:00:00 2332 44496
78 2020-05-05 00:00:00 2350 46846
79 2020-05-06 00:00:00 2110 48956
80 2020-05-07 00:00:00 2352 51308
81 2020-05-08 00:00:00 2720 54028
82 2020-05-09 00:00:00 2416 56444
83 2020-05-10 00:00:00 3254 59698
84 2020-05-11 00:00:00 3013 62711
85 2020-05-12 00:00:00 2727 65438
86 2020-05-13 00:00:00 2659 68097
87 2020-05-14 00:00:00 2671 70768
88 2020-05-15 00:00:00 3943 74711
89 2020-05-16 00:00:00 3004 77715
90 2020-05-17 00:00:00 2874 80589
91 2020-05-18 00:00:00 4130 84719
92 2020-05-19 00:00:00 3224 87943
93 2020-05-20 00:00:00 4398 92341
94 2020-05-21 00:00:00 3045 95386
95 2020-05-22 00:00:00 3848 99234
96 2020-05-23 00:00:00 3551 102785
97 2020-05-24 00:00:00 3337 106122
98 2020-05-25 00:00:00 5020 111142
99 2020-05-26 00:00:00 3680 114822
100 2020-05-27 00:00:00 3516 118338
101 2020-05-28 00:00:00 3997 122335
102 2020-05-29 00:00:00 4061 126396
103 2020-05-30 00:00:00 3905 130301
104 2020-05-31 00:00:00 3641 133942
105 2020-06-01 00:00:00 6614 140556
106 2020-06-02 00:00:00 4137 144693
107 2020-06-03 00:00:00 4097 148790
108 2020-06-04 00:00:00 4249 153039
109 2020-06-05 00:00:00 5244 158283
110 2020-06-06 00:00:00 4934 163217
111 2020-06-07 00:00:00 4187 167404
112 2020-06-08 00:00:00 5571 172975
113 2020-06-09 00:00:00 4521 177496
114 2020-06-10 00:00:00 6072 183568
115 2020-06-11 00:00:00 4407 187975
116 2020-06-12 00:00:00 5157 193132
117 2020-06-13 00:00:00 4591 197723
118 2020-06-14 00:00:00 4456 202179
119 2020-06-15 00:00:00 6855 209034
120 2020-06-16 00:00:00 5153 214187
121 2020-06-17 00:00:00 4455 218642
122 2020-06-18 00:00:00 5436 224078
123 2020-06-19 00:00:00 5544 229622
124 2020-06-20 00:00:00 7166 236788
125 2020-06-21 00:00:00 4581 241369
126 2020-06-22 00:00:00 5848 247217
127 2020-06-23 00:00:00 5080 252297
128 2020-06-24 00:00:00 5022 257319
129 2020-06-25 00:00:00 5987 263306
130 2020-06-26 00:00:00 6490 269796
131 2020-06-27 00:00:00 5087 274883
132 2020-06-28 00:00:00 6077 280960
133 2020-06-29 00:00:00 6439 287399
134 2020-06-30 00:00:00 6393 293792
135 2020-07-01 00:00:00 8102 301894
136 2020-07-02 00:00:00 5922 307816
137 2020-07-03 00:00:00 6368 314184
138 2020-07-04 00:00:00 5580 319764
139 2020-07-05 00:00:00 6099 325863
140 2020-07-06 00:00:00 6773 332636
141 2020-07-07 00:00:00 6139 338775
142 2020-07-08 00:00:00 5629 344404
143 2020-07-09 00:00:00 5737 350141
144 2020-07-10 00:00:00 8722 358863
145 2020-07-11 00:00:00 5610 364473
146 2020-07-12 00:00:00 5924 370397
147 2020-07-13 00:00:00 7152 377549
148 2020-07-14 00:00:00 5965 383514
149 2020-07-15 00:00:00 7520 391034
150 2020-07-16 00:00:00 5971 397005
151 2020-07-17 00:00:00 6712 403717
152 2020-07-18 00:00:00 6668 410385
153 2020-07-19 00:00:00 5903 416288
154 2020-07-20 00:00:00 9197 425485
155 2020-07-21 00:00:00 5563 431048
156 2020-07-22 00:00:00 5527 436575
157 2020-07-23 00:00:00 5396 441971
158 2020-07-24 00:00:00 5887 447858
159 2020-07-25 00:00:00 6834 454692
160 2020-07-26 00:00:00 5144 459836
161 2020-07-27 00:00:00 6634 466470
162 2020-07-28 00:00:00 5467 471937
163 2020-07-29 00:00:00 4663 476600
164 2020-07-30 00:00:00 4796 481396
165 2020-07-31 00:00:00 5027 486423
166 2020-08-01 00:00:00 7395 493818
167 2020-08-02 00:00:00 4827 498645
168 2020-08-03 00:00:00 5757 504402
169 2020-08-04 00:00:00 4470 508872
170 2020-08-05 00:00:00 5126 513998
171 2020-08-06 00:00:00 4365 518363
172 2020-08-07 00:00:00 4844 523207
173 2020-08-08 00:00:00 4990 528197
174 2020-08-09 00:00:00 4112 532309
175 2020-08-10 00:00:00 6718 539027
176 2020-08-11 00:00:00 4228 543255
177 2020-08-12 00:00:00 4124 547379
178 2020-08-13 00:00:00 4017 551396
179 2020-08-14 00:00:00 4517 555913
180 2020-08-15 00:00:00 4638 560551
181 2020-08-16 00:00:00 3583 564134
182 2020-08-17 00:00:00 3890 568024
183 2020-08-18 00:00:00 3479 571503
184 2020-08-19 00:00:00 2378 573881
185 2020-08-20 00:00:00 2426 576307
186 2020-08-21 00:00:00 1507 577814
187 2020-08-22 00:00:00 865 578679
188 2020-08-23 00:00:00 672 579351
189 2020-08-24 00:00:00 413 579764
190 2020-08-25 00:00:00 132 579896
191 2020-08-26 00:00:00 18 579914

No solo podemos revisar los casos confirmados también ver el número de fallecimientos por día y su acumulado.

Antes de las visualizaciones observamos otra inconsistencia en sujetos que tienen registrada una fecha de defunción pero antes de que se registrará la fecha de los sintomas o personas con fecha de fallecimiento antes de los primeros casos de COVID-19 en México.

Comó se menciono anteriormente, esto puede ser por un error al registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO FECHA_SINTOMAS FECHA_DEF INTUBADO NEUMONIA
358296 2020-08-27 14ca54 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-02-11 2020-02-11 2020-03-01 SI SI
623206 2020-08-27 1731ab 1 IMSS 9 MUJER MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-05-24 2020-05-24 2020-04-13 NO SI
1169613 2020-08-27 009132 1 IMSS 27 HOMBRE TABASCO TABASCO HOSPITALIZADO 2020-07-29 2020-07-29 2020-06-29 NO SI
1254140 2020-08-27 1c2b09 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-07-26 2020-07-26 2020-06-27 NO SI

Una manera de visualizar los datos de confirmados y fallecimientos es mediante un gráfico de área ya que en este caso los fallecimientos contados son un grupo de los sujetos confirmados y podemos comparar su proporción.

O gráficar con barras para cada día.

Preguntas que podemos explorar

Utilizando los datos de los casos confirmados, ¿Cuántos ingresaron en hospitales?

Para esto ocupamos la columna TIPO_PACIENTE que contiene valores como Hospitalizado que significa que esta o estuvo presente en un Hospital y Ambulatoria que significa que fue confirmado con COVID-19 pero que no ingreso a un hospital.

Seleccionando a los sujetos confirmados con COVID-19 y que se ingresaron en algún hospital, ¿Cuántos fueron entubados?

Para responder esto ocupamos la columna INTUBADO en la que se señala si el sujeto tuvo que ser intubado como un signo de la complicación de la enfermedad.

TIPO_PACIENTE SEXO CONTEOS
0 AMBULATORIA HOMBRE 214024
1 AMBULATORIA MUJER 217228
2 HOSPITALIZADO HOMBRE 90714
3 HOSPITALIZADO MUJER 57948

Podemos ocupar un gráfico de box plot para saber la distribución de la edad de las personas confirmadas que se encontraron en el hospital.

Podemos crear rangos de edad y observar que grupo es el que ha presentado más casos que requieran hospitalización.

En México siempre se ha mantenido las "noticias" acerca de que los hospitales se encuentran llenos y hemos visto las conferencias acerca de la expansión en hospitales dependendiendo de la situación que se encuentran los Estados. Lamentablemente, con los datos que estamos trabajando en este momento no hay información de esta capacidad en hospitales pero si podemos visualizar el número de personas que se encontraron en los distintos tipos de hospitales.

Commorbilidades

Otro problema que existe en México son las enfermedades que complican la condición del paciente con COVID-19. Entre las más importantes se encuentran Obesidad, Diabetes e Hipertensión. Observando los datos registrados hasta 2016, México presenta un crecimiento en el porcentaje de adultos con obesidad cada año. La siguente gráfica muestra el porcentaje en distintos paises desde 1975 al 2016, incluyendo Mexico.

Ahora en relación con COVID-19, podemos ver el número de personas confirmadas, saber si presentan obesidad y su condición en el hospital.

La misma situación pero con las otras dos cormobilidades, Diabetes e hipertension que estan estrechamente relacionadas con la Obesidad.

Siguiendo el interés de las co-morbilidades podemos clasificar cada paciente con el número de las enfermades que se mencionaron anteriormente ya que son las que presentaron y presentan un mayor riesgo.

Hasta el momento, solo hemos explorado los datos de las personas confirmadas con COVID-19 desde el inicio de la pandemia en México, no las personas que actualmente presentan la enfermedad.

Usando el número de personas confirmadas con COVID19 y con la población total de cada Estado (datos de 2017) podemos determinar el número total de fallecimientos en cada Estado por cada 100 000 habitantes.

O la otra manera que podemos ver los lamentables fallecimientos es por el total de confirmados de COVID-19 en cada Estado. No es la forma más adecuada de ver estos datos, ya que como han explicado, depende mucho del número de pruebas que se hacen. Por lo que muchas pruebas solo reduciría la proporción de fallecimientos por total de confirmados. Pero puede ser útil para ver algúna localidad en la que la proporcion de falleciemientos aumente y tratar de determinar las posibles causas.

Otra manera de ver la relación entre el número de fallecimientos y el número de confirmados mediante un gráfico denominado scatterplot en el que cada punto representa una entidad Federativa.

El siguiente gráfico muestra los casos confirmados en cada Estado desde el inicio de la pandemia en México hasta el día de hoy.

Ya que los datos presentan tanto el Estado como el minicipio podemos realizar un gráfico denominado treemap que nos permite observar los casos totales por localidad y el tamaño de los cuadros es por número correspondiente.

En el caso de los Recuperados, según los informes de la Secretaría de Salud, son los casos después de 15 días al inicio de los síntomas.

Si seleccionamos los casos confirmados de las últimas dos semanas tendríamos los casos que se consideran activos ya que se toma en cuenta que la enfermedad tiene una duración promedio de 14 días. Puede ser que esta restricción no contemple todos los activos ya que pueden existir casos en los que la recuperación sea lenta sin embargo, una alta proporcion de los casos activos se encuentran con el criterio tomado.

Podemos ocupar estos casos activos para generar un treemap.

Casos Por día

Una manera de poder ver el número de casos nuevos por dia es usando un heatmap en que podemos ver el crecimiento de casos por cada 100K personas del Estado. Para poder apreciar mejor el número de casos se calcula el logaritmo base 10. La idea original de esta visualización la puedes encontrar en el siguente artículo:

https://towardsdatascience.com/visualization-of-covid-19-new-cases-over-time-in-python-8c6ac4620c88

Duración epidémica

También es posible explorar la duración de la epidemia COVID19 en cada uno de los Estados. Esto quiere decir tomar el registro de cuando se dio el primer caso confirmado de COVID19 en cada uno de los Estados y continuar el lapso hasta el último día en el que se registro una confirmació. De esta manera podremos ver si algún Estado ha dejado de tener casos.

Debido a los errores al momento de registrar los datos, como se mencionó anteriormente, se tomarán en cuenta solo los datos a partir de inicios de Marzo 2020 que fue de las fechas oficiales.

Teniendo en cuenta este último gráfico, podemos revisar por día como fueron los distintos casos (no acumulados).

El siguente calendario muestra la intensidad de los casos confirmados en todo México por día. Es necesario considerar que debido a los errores de anotación que se describieron anteriormente el calendario iniciaria en Enero y Febrero cuando no en realidad no fue asi. Sin embargo, no se eliminaron ya que cuentan como casos postivos.

También es posible revisar los casos recuperados y observarlos en un calendario.

Y por último los fallecimientos por día.